几何感知递归网络移动视觉场景理解自运动估计和稳定空间感知潜在特征状态检测和分割对象的3D

几何感知递归网络：移动视觉场景的3D特征图学习与预测

标签：几何感知递归网络移动视觉场景理解自运动估计和稳定空间感知潜在特征状态检测和分割对象的3D

2595基于几何感知递归网络小渔鱼东1号 Ricson Cheng2陈嘉玲Katerina Fragkiadaki11卡内基梅隆大学2优步先进技术集团{htung，katef}@ cs.cmu.edu，[email protected]摘要我们将两个强大的想法，几何和深度视觉表示学习...

GA-DAN：几何感知域自适应网络用于场景文本检测和识别的研究

标签：几何感知域自适应网络跨域转移建模多模态空间学习圈一致性损失算法场景文本检测和识别

DAN：用于场景文本检测和识别的几何感知域自适应网络Fangneng Zhan，Chuhui Xue，and ShijianLu南洋理工大学{fnzhan，Shijian.Lu}@ ntu.edu.sg，[email protected]摘要最近的对抗性学习研究在对表观空间中的跨域...

自动驾驶-状态估计和定位-递归贝叶斯滤波(Bayes Filter).pdf

标签：自动驾驶状态估计和定位递归贝叶斯滤波 BayesFilter

自动驾驶-状态估计和定位-递归贝叶斯滤波(Bayes+Filter)算法讲解

自动驾驶汽车中的对象检测和场景感知深度学习：调查、挑战和开放问题

标签：自动驾驶中的对象检测场景感知深度学习多模态传感器融合

阵列10（2021）100057自动驾驶汽车中的对象检测和场景感知深度学习：调查，挑战和开放问题Abhishek Gupta，Alagan Anpalagan*，Ling Guan，Ahmed Shaharyar Khwaja瑞尔森大学，350 Victoria Street，Toronto，M5B2K3...

朝向场景理解的无监督单目深度估计：基于语义感知表示和对象几何结构建模的方法

[email protected], [email protected]摘要0单目深度估计是场景理解中的一项具有挑战性的任务，其目标是从2D图像中获取3D空间的几何属性。由于缺乏RGB-深度图像对，无监督学习方法旨在通过替代监督（如立体图对）...

基于运动分组的自监督视频对象分割

标签：自监督视频对象分割牛津大学视觉几何小组运动分组分割伪装的动物感知分组

7177基于运动分组的自监督视频对象分割牛津大学视觉几何小组{charig，lamdouar，erika，az，weidi} @ robots.ox.ac.ukhttps://charigyang.github.io/motiongroup/图1：分割伪装的动物。运动在增强我们的视觉系统在...

基于特征金字塔的场景文本检测

标签：卷积神经网络；场景文本检测递归神经网络

自然场景文本检测就是从自然场景中检测出文本所在的位置，检测结果的好坏将直接影响后续的文本识别效果，其在图像检索、自动驾驶等领域具有重要应用。本文提出了一个 CNN 与 RNN 联合的自然场景文本检测方法。首先，...

以栅格为中心的自动驾驶交通场景感知综述

标签：自动驾驶人工智能深度学习

然而，在自动驾驶中，以栅格为中心的感知不如以对象为中心的感知那么普遍，因为自动驾驶汽车需要准确地感知高度动态的大规模室外交通场景，并且以栅格为中心的感知的复杂性和计算成本很高。深度学习技术和硬件的快速...

通俗理解卡尔曼滤波（无人驾驶感知融合的经典算法）

标签：算法概率论机器学习

后2015年和团队一块创业创办AI职教平台「七月在线」，至今已近7年，这6 7年我们把AI做透了，同行没做的我们做，同行没有的广度我们有，同行不到的深度我们到。六年多来，在专注做成人AI职教的同时，面对过很多行业...

语义一致性的空间和时间连贯分割与重建的复杂动态场景

标签：语义共分割时间一致性动态场景 3D重建深度学习

4321动态场景Armin Mustafa Adrian Hilton CVSSP，联合王国{a.mustafa，a.hilton}@ surrey.ac.uk摘要在本文中，我们提出了一个框架的空间和时间连贯的语义共同分割和重建的复杂动态场景从多个静态或移动摄像机。...

双注意力引导的野外凝视目标检测方法在3D空间中的应用

标签：个文件的5个标签三阶段的凝视目标检测 2D和3D凝视推理

11390双注意力引导的野外易芳1 <$、汤佳鹏...在第一阶段中，我们引入了一种从粗到细的策略来鲁棒地估计来自头部的3D预测的注视被分解为图像平面上的平面注视和深度通道注视。在第二阶段，我们开发了一个双注意力模块（D

从单个RGB图像中的3D物体部件分解和重建

标签：单个RGB图像 3D世界感知卷积神经网络对象的层次结构部件的组织

[email protected]摘要人类将3D世界感知为一组不同的物体，其特征在于各种低级（几何形状，反射率）和高级（连接性，邻接性，对称性）属性。最近基于卷积神经网络（CN

基于递归神经网络的单目视频视觉里程和深度的方法

1基于递归神经网络的单目视频视觉里程和深度的放大图片作者：Stephen M.Pizer，Jan-MichaelFrahm北卡罗来纳大学教堂山分校摘要基于深度学习的单视图深度估计方法最近显示出非常有希望的结果。然而，这样的方法忽略了...

大盘点|三维视觉与自动驾驶数据集（40个）

标签：计算机视觉人工智能机器学习

作者丨深蓝学院@知乎来源丨https://zhuanlan.zhihu.com/p/393348763编辑丨3D视觉工坊本文整理了当下主流的三维视觉（图像、点云）与自动驾驶数据集，数据集会...

自动驾驶的“天眼”！聊一聊高精地图领域中所有主流的制作方案

标签：传感器算法大数据

点击上方“3D视觉工坊”，选择“星标”干货第一时间送达作者丨汽车人来源丨自动驾驶之心1自动驾驶中的高精地图生成技术在过去几年中，自动驾驶一直是最受欢迎和最具挑战性的话题之一。在实现完全自主的道路上，研究...

"动态环境中自主车辆安全运动规划的自监督自由空间预测

标签：自监督自由空间预测安全局部运动规划中心表示对象未来自由空间预测免费监督学习

12732具有自监督自由空间预测的安全局部运动规划胡佩云1，黄亚伦1，约翰多兰1，大卫赫尔德1，德瓦拉马南1，21机器人研究所，卡内基梅隆大学，2阿尔戈人工智能{peiyunh@cs，aaronhua@andrew，jdolan@andrew，dhold @...

视觉-惯性目标检测和映射

标签：视觉-惯性目标检测斯特凡诺·索亚托加州大学洛杉矶分校视觉实验室文件标签

该系统包括自下而上和自上而下的组件，由此被训练用于检测的深度网络提供由非线性滤波器提供的对象假设的似然分数，该非线性滤波器的状态用作记忆。额外的网络提供边缘的似然性得分，这补充了被训练为对小

自动驾驶综述|定位、感知、规划常见算法汇总

标签：自动驾驶算法人工智能

感知系统负责使用车载传感器捕获的数据，如光探测和测距（LIDAR）、无线电探测和测距（雷达）、摄像机、全球定位系统（GPS），惯性测量单元（IMU）、里程表，以及有关传感器模型、道路网络、交通规则、汽车动力学等...

视频对象检测中基于序列级语义聚合的方法

标签：视频对象检测序列级语义聚合光流或递归神经网络全序列水平聚集功能最先进的结果

9217基于序列级语义聚合的视频对象检测吴海平1陈云涛3，4王乃艳2张兆祥3，4，51麦吉尔大学2TuSimple3中国科学4中国科学院智能感知与计算研究中心5中国科学院脑科学与智能技术卓越中心mail.mcgill.ca{chenyuntao2016...

【最新综述】史上最全面的3D语义分割综述（下）

标签： 3d

由于三维实例分割是一项对场景理解更有参考价值的任务，因此越来越受到研究界的关注。三维实例分割方法大致分为两个方向：proposal-based和proposal-free。基于提议的方法首先预测对象提议，然后对其进行完善，生成...

动态对象的无监督发现与移动分割

标签：动态对象发现外观线索利用无监督对象发现基于运动线索的方法

11789发现可以移动Zhipeng Bao*，†，1Pavel Tokmakov*，2Allan Jabri3Yu-Xiong Wang4Adrien Gaidon2Martial Hebert11CMU2丰田研究所3加州大学伯克利分校4UIUC摘要本文研究了目标发现问题现有的方法利用外观线索，如...

基于卷积递归网络的道路边界提取

标签：道路边界提取卷积递归网络高清地图自动驾驶汽车地图精度

9512基于卷积递归网络的道路边界提取Justin Liang1岁 Namdar Homayounfar1，2岁马伟秋1，3王神龙1，2拉克尔·乌塔孙1，21Uber Advanced Technologies Group2多伦多大学3MIT{justin.liang，namdar，weichiu，slwang，...